Fechar

1. Identificação
Tipo de ReferênciaTese ou Dissertação (Thesis)
Sitemtc-m21c.sid.inpe.br
Código do Detentorisadg {BR SPINPE} ibi 8JMKD3MGPCW/3DT298S
Identificador8JMKD3MGP3W34R/4257LEL
Repositóriosid.inpe.br/mtc-m21c/2020/03.09.19.33
Última Atualização2020:08.10.15.02.48 (UTC) simone
Repositório de Metadadossid.inpe.br/mtc-m21c/2020/03.09.19.33.23
Última Atualização dos Metadados2020:08.13.04.13.47 (UTC) administrator
Chave SecundáriaINPE-18297-TDI/2973
Chave de CitaçãoBarchi:2020:MaDeLe
TítuloMachine and deep learning applied to galaxy morphology
Título AlternativoAprendizado de máquina tradicional e profundo aplicado a morfologia de galáxias
CursoCAP-COMP-SESPG-INPE-MCTIC-GOV-BR
Ano2020
Data2020-03-09
Data de Acesso06 maio 2024
Tipo da TeseTese (Doutorado em Computação Aplicada)
Tipo SecundárioTDI
Número de Páginas83
Número de Arquivos1
Tamanho9586 KiB
2. Contextualização
AutorBarchi, Paulo Henrique
BancaQueiroz, Gilberto Ribeiro de (presidente)
Rosa, Reinaldo Roberto (orientador)
Carvalho, Reinaldo Ramos de (orientador)
Körting, Thales Sehn
Menéndez-Delmestre, Karín
Oliveira Filho, Irapuan Rodrigues de
Endereço de e-Mailpaulobarchi@gmail.com
UniversidadeInstituto Nacional de Pesquisas Espaciais (INPE)
CidadeSão José dos Campos
Histórico (UTC)2020-03-09 19:36:25 :: paulobarchi@gmail.com -> pubtc@inpe.br ::
2020-03-10 16:50:39 :: pubtc@inpe.br -> paulobarchi@gmail.com ::
2020-04-22 15:42:29 :: paulobarchi@gmail.com -> pubtc@inpe.br ::
2020-04-24 11:26:14 :: pubtc@inpe.br -> paulobarchi@gmail.com ::
2020-04-28 15:30:17 :: paulobarchi@gmail.com -> administrator ::
2020-08-10 14:45:22 :: administrator -> pubtc@inpe.br ::
2020-08-11 20:29:59 :: pubtc@inpe.br -> simone ::
2020-08-11 20:34:00 :: simone :: -> 2020
2020-08-12 17:30:39 :: simone -> administrator :: 2020
2020-08-13 04:13:47 :: administrator -> :: 2020
3. Conteúdo e estrutura
É a matriz ou uma cópia?é a matriz
Estágio do Conteúdoconcluido
Transferível1
Palavras-Chavecomputational astrophysics
galaxy morphology
machine learning
deep learning
astrofísica computacional
morfologia de galáxias
aprendizado de máquina
aprendizado de máquina profundo
ResumoMorphological classification is a key piece of information to define samples of galaxies aiming to study the large-scale structure of the universe. In essence, the challenge is to build up a robust methodology to perform a reliable morphological estimate from galaxy images. Here, I investigate how to substantially improve the galaxy classification within large datasets by mimicking human classification. I combine accurate visual classifications from the Galaxy Zoo project with machine and deep learning methodologies. I propose two distinct approaches for galaxy morphology: one based on non-parametric morphology and traditional machine learning algorithms; and another based on deep learning. To measure the input features for the traditional machine learning methodology, I and my collaborators have developed a system called CyMorph, with a novel non-parametric approach to study galaxy morphology. The main datasets employed comes from the Sloan Digital Sky Survey Data Release 7 (SDSS-DR7). I also discuss the class imbalance problem considering three classes. Performance of each model is mainly measured by overall accuracy (OA). A spectroscopic validation with astrophysical parameters is also provided for Decision Tree models to assess the quality of our morphological classification. In all of our samples, both Deep and Traditional Machine Learning approaches have over 94.5% OA to classify galaxies in two classes (elliptical and spiral). I compare our classification with state-of-the-art morphological classification from literature. Considering only two classes separation, I achieve 99% OA in average when using our deep learning models, and 82% when using three classes. I provide a catalog with 670,560 galaxies containing our best results, including morphological metrics and classification. RESUMO: Classificação morfológica é peça chave de informação para definir amostras de galáxias com objetivo de estudar a estrutura do Universo em larga-escala. Em essência, o desafio é construir uma metodologia robusta para produzir uma estimativa morfológica confiável a partir de imagens de galáxias. Aqui, investigo como melhorar substancialmente a classificação automática de galáxias em grandes conjuntos de dados ao imitar a classificação fornecida por humanos. Combino classificações visuais do projeto Galaxy Zoo com metodologias de aprendizado de máquina tradicional e profundo. Proponho duas abordagens distintas para morfologias de galáxias: uma baseada em morfologia não-paramétrica e algoritmos de aprendizado de máquina tradicional; e outra baseada em aprendizado profundo. Para medir as características morfológicas de entrada para algoritmos de aprendizado de máquina tradicional, desenvolvi com meus colaboradores um sistema chamado CyMorph, com uma nova abordagem não-paramétrica para estudar morfologia de galáxias. O principal conjunto de dados explorado provém do Sloan Digital Sky Survey Data Release 7 (SDSS-DR7). Também discuto o problema de desbalanceamento de classes considerando o problema com três classes. A performance de cada modelo é medida principalmente por acurácia global. A validação espectroscópica com parâmetros astrofísicos também é fornecida para os modelos de Árvore de Decisão para avaliar a qualidade de nossa classificação morfológica. Em todas as nossas amostras, tanto com aprendizado de máquina profundo como tradicional, obtenho mais de 94.5% de acurácia global para classificar galáxias em duas classes (elíptica e espiral). Comparo minha classificação com classificações morfológicas do estado-da-arte da literatura. Considerando apenas duas classes, atingi 99% de acurácia global e média usando modelos de aprendizado profundo, e 82% usando três classes. Forneço uma catálogo com 670.560 galáxias contendo nossos melhores resultados, incluindo métricas morfológicas e classificações.
ÁreaCOMP
Arranjourlib.net > Produção pgr ATUAIS > CAP > Machine and deep...
Conteúdo da Pasta docacessar
Conteúdo da Pasta source
originais/@4primeirasPaginas.pdf 07/08/2020 20:33 411.2 KiB 
originais/aprovacao.pdf 12/08/2020 08:28 833.1 KiB 
originais/BarchiPH_Thesis-1.pdf 28/04/2020 14:33 7.9 MiB
Conteúdo da Pasta agreement
agreement.html 09/03/2020 16:33 1.7 KiB 
autorizacao.pdf 10/08/2020 12:01 312.2 KiB 
4. Condições de acesso e uso
URL dos dadoshttp://mtc-m21c.sid.inpe.br/ibi/8JMKD3MGP3W34R/4257LEL
URL dos dados zipadoshttp://mtc-m21c.sid.inpe.br/zip/8JMKD3MGP3W34R/4257LEL
Idiomaen
Arquivo Alvopublicacao.pdf
Grupo de Usuáriospaulobarchi@gmail.com
pubtc@inpe.br
simone
Visibilidadeshown
Licença de Direitos Autoraisurlib.net/www/2012/11.12.15.10
Detentor dos Direitosoriginalauthor yes
Permissão de Leituraallow from all
Permissão de Atualizaçãonão transferida
5. Fontes relacionadas
Repositório Espelhourlib.net/www/2017/11.22.19.04.03
Unidades Imediatamente Superiores8JMKD3MGPCW/3F2PHGS
Lista de Itens Citandosid.inpe.br/bibdigital/2013/10.12.22.16 1
Acervo Hospedeirourlib.net/www/2017/11.22.19.04
6. Notas
Campos Vaziosacademicdepartment affiliation archivingpolicy archivist callnumber contenttype copyholder creatorhistory descriptionlevel dissemination doi electronicmailaddress format group isbn issn label lineage mark nextedition notes number orcid parameterlist parentrepositories previousedition previouslowerunit progress readergroup resumeid schedulinginformation secondarydate secondarymark session shorttitle sponsor subject tertiarymark tertiarytype url versiontype


Fechar